Classification non supervisée des données hétérogènes à large échelle

نویسندگان

  • Mohamed Ali Zoghlami
  • Olfa Arfaoui
  • Minyar Sassi Hidri
  • Rahma Ben Ayed
چکیده

Résumé. Quand il sera question de classifier des données massives, le temps de réponse, l’accès disque et la qualité des classes formées deviennent des enjeux majeurs pour les entreprises. C’est dans ce cadre que nous avons été amenés à définir un cadre de classification non supervisée des données hétérogènes à large échelle qui contribue à la résolution de ces enjeux. Le cadre proposé s’articule autour de l’analyse descriptive à base d’Analyse des Correspondances Multiples (ACM) d’une part, et d’autre part du paradigme de programmation parallèle MapReduce dans un environnement à large échelle. Les résultats obtenus sont encourageants et prouvent l’efficience du déploiement hybride sur le volet qualité et temps de réponse autant sur des données qualitatives et quantitatives.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Extraction non supervisée de motifs temporels, multidimensionnels et hétérogènes Application à la télésurveillance médicale à domicile

Résumé. Une méthode générique pour l’extraction non supervisée de motifs dans des séquences temporelles multidimensionnelles et hétérogènes est proposée, puis expérimentée pour l’identification des comportements récurrents d’une personne à domicile. L’objectif est de concevoir un système d’apprentissage des habitudes de vie, à partir des données de capteurs, pour la détection d’évolutions criti...

متن کامل

Visualisation de l'intra et inter structure des groupes en classification non supervisée

Résumé. La croissance exponentielle des données engendre des volumétries de bases de données très importantes. Une solution couramment envisagée est l’utilisation d’une description condensée des propriétés et de la structure des données. De ce fait, il devient crucial de disposer d’outils de visualisation capables de représenter la structure des données, non pas à partir des données elles mêmes...

متن کامل

Classification probabiliste non supervisée et visualisation des données séquentielles

Résumé. Nous proposons dans ce papier un nouvel algorithme de classification non supervisée à base de modèle de mélange topologique pour des données non i.i.d (non independently and identically distributed). Ce nouveau paradigme probabiliste, plonge les cartes topologiques probabilistes dans une formulation sous forme de chaînes de Markov cachées. Dans cette formulation, la génération d’une obs...

متن کامل

Une nouvelle méthode divisive de classification non supervisée pour des données symboliques intervalles

Résumé. Dans cet article nous présentons une nouvelle méthode de classification non supervisée pour des données symboliques intervalles. Il s’agit de l’extension d’une méthode de classification non supervisée classique à des données intervalles. La méthode classique suppose que les points observés sont la réalisation d’un processus de Poisson homogène dans k domaines convexes disjoints de R. La...

متن کامل

Combinaison de classification supervisée, non-supervisée par la théorie des fonctions de croyance

Résumé. Nous proposons dans cet article une nouvelle approche de classification fondée sur la théorie des fonctions de croyance. Cette méthode repose sur la fusion entre la classification supervisée et la classification non supervisée. En effet, nous sommes face à un problème de manque de données d’apprentissage pour des applications dont les résultats de classification supervisée et non superv...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • CoRR

دوره abs/1707.00297  شماره 

صفحات  -

تاریخ انتشار 2017